智能论文笔记

FUSION: Fully Unsupervised Test-Time Stain Adaptation via Fused Normalization Statistics

Nilanjan Chattopadhyay , Shiv Gehlot , Nitin Singhal

分类：计算机视觉 | 机器学习

2022-08-30

染色揭示了抽吸物的微结构，同时创建组织病理学幻灯片。染色变异被定义为源和目标之间的色差差异，是由于染色过程中的特征变化引起的，导致分布变化和目标的性能差。染色归一化的目的是将目标的色谱分布与源的色谱分布相匹配。然而，染色归一化会导致潜在的形态变形，从而导致错误的诊断。我们提出了Fusion，这是一种通过在无监督的测试时间方案中调整模型来促进污渍适应的新方法，从而消除了目标末端进行重大标记的必要性。 Fusion通过更改目标的批准统一统计数据，并使用加权因子将其与源统计融合在一起。根据加权因子，该算法减少到两个极端之一。尽管缺乏培训或监督，但融合超过了分类和密集预测（细分）的现有等效算法，如两个公共数据集上的全面实验所证明的那样。

translated by 谷歌翻译

HTML版本

Detecting Severity of Diabetic Retinopathy from Fundus Images using Ensembled Transformers

Chandranath Adak , Tejas Karkera , Soumi Chattopadhyay , Muhammad Saqib

分类：计算机视觉 | 人工智能

2023-01-03

Diabetic Retinopathy (DR) is considered one of the primary concerns due to its effect on vision loss among most people with diabetes globally. The severity of DR is mostly comprehended manually by ophthalmologists from fundus photography-based retina images. This paper deals with an automated understanding of the severity stages of DR. In the literature, researchers have focused on this automation using traditional machine learning-based algorithms and convolutional architectures. However, the past works hardly focused on essential parts of the retinal image to improve the model performance. In this paper, we adopt transformer-based learning models to capture the crucial features of retinal images to understand DR severity better. We work with ensembling image transformers, where we adopt four models, namely ViT (Vision Transformer), BEiT (Bidirectional Encoder representation for image Transformer), CaiT (Class-Attention in Image Transformers), and DeiT (Data efficient image Transformers), to infer the degree of DR severity from fundus photographs. For experiments, we used the publicly available APTOS-2019 blindness detection dataset, where the performances of the transformer-based models were quite encouraging.

translated by 谷歌翻译

PASTA: Proportional Amplitude Spectrum Training Augmentation for Syn-to-Real Domain Generalization

Prithvijit Chattopadhyay , Kartik Sarangmath , Vivek Vijaykumar , Judy Hoffman

分类：计算机视觉 | 人工智能 | 机器学习

2022-12-02

Synthetic data offers the promise of cheap and bountiful training data for settings where lots of labeled real-world data for tasks is unavailable. However, models trained on synthetic data significantly underperform on real-world data. In this paper, we propose Proportional Amplitude Spectrum Training Augmentation (PASTA), a simple and effective augmentation strategy to improve out-of-the-box synthetic-to-real (syn-to-real) generalization performance. PASTA involves perturbing the amplitude spectrums of the synthetic images in the Fourier domain to generate augmented views. We design PASTA to perturb the amplitude spectrums in a structured manner such that high-frequency components are perturbed relatively more than the low-frequency ones. For the tasks of semantic segmentation (GTAV to Real), object detection (Sim10K to Real), and object recognition (VisDA-C Syn to Real), across a total of 5 syn-to-real shifts, we find that PASTA outperforms more complex state-of-the-art generalization methods while being complementary to the same.

translated by 谷歌翻译

On Language Clustering: A Non-parametric Statistical Approach

Anagh Chattopadhyay , Soumya Sankar Ghosh , Samir Karmakar

分类：自然语言处理

2022-09-14

旨在进行巴氏杀菌和量化特定现象的任何方法都必须包括使用强大的统计方法进行数据分析。考虑到这一点，这项研究的目的是介绍非参数非均匀数据框架中可能采用的统计方法，并检查其在自然语言处理和语言集群领域的应用。此外，本文讨论了语言数据挖掘和处理中非参数方法的许多用途。数据深度思想允许在任何维度上进行中心排序，从而导致新的非参数多元统计分析，该分析不需要任何分布假设。层次结构的概念用于历史语言分类和结构化，其目的是使用相同的前提将语言组织和聚集到亚家族中。在这方面，当前的研究提出了一种基于通过各种语言的单词类型结构产生的非参数方法的语言家族结构的新方法，然后使用MDS将其转换为笛卡尔框架。这种基于统计深度的架构允许使用基于数据深度的方法来实现强大的离群检测，这对于理解各种边界语言的分类非常有用，并允许对现有分类系统进行重新评估。其他基于深度的方法也适用于无监督和监督聚类等过程。因此，本文概述了可以在非参数框架中应用于非均匀语言分类系统的过程。

translated by 谷歌翻译

Human-Guided Planning for Complex Manipulation Tasks Using the Screw Geometry of Motion

Dasharadhan Mahalingam , Nilanjan Chakraborty

分类：机器人

2022-09-13

在本文中，我们提出了一种新的运动计划，用于通过使用人类演示并利用运动的螺钉几何形状来执行复杂的操纵任务。我们考虑复杂的操纵任务，其中对机器人终端效应器的运动有限制。此类任务的示例包括打开门，打开抽屉，将颗粒材料从一个容器中转移到另一个容器到另一个容器，然后将菜肴加载到洗碗机上。我们的方法由两个步骤组成：首先，使用这样一个事实，即可以通过使用一系列恒定螺钉运动来近似机器人任务空间中的运动，我们将人的演示分为一系列恒定螺钉运动。其次，我们使用分段螺钉通过螺钉线性插值来生成运动计划，以实现相同任务的其他实例。螺钉分割的使用使我们能够以无坐标的方式捕获演示的不变性，从而使我们能够计划从一个示例中为不同的任务实例计划。我们对各种操纵场景提出了广泛的实验结果，表明我们的方法可以在各种操纵任务中使用。

translated by 谷歌翻译

Unsupervised diffeomorphic cardiac image registration using parameterization of the deformation field

Ameneh Sheikhjafari , Deepa Krishnaswamy , Michelle Noga , Nilanjan Ray , Kumaradevan Punithakumar

分类：计算机视觉 | 机器学习

2022-08-28

这项研究提出了一个基于移动网格参数化的端到端无监督的差异可变形登记框架。使用此参数化，可以使用其转换雅各布的决定因素和末端速度场的卷曲来建模。变形场的新模型具有三个重要优势。首先，它放松了对成本函数的显式正则化项和相应重量的需求。平滑度隐含在溶液中，从而导致物理上合理的变形场。其次，它通过适用于转换雅各布决定因素的明确约束来保证差异性。最后，它适用于心脏数据处理，因为该参数化的性质是根据径向和旋转成分定义变形场。通过在包括2D和3D心脏MRI扫描在内的三个不同数据集上评估拟议方法来研究算法的有效性。结果表明，所提出的框架在生成差异变换的同时优于现有的基于学习的方法和基于非学习的方法。

translated by 谷歌翻译

HTML版本

Tiny-HR: Towards an interpretable machine learning pipeline for heart rate estimation on edge devices

Preetam Anbukarasu , Shailesh Nanisetty , Ganesh Tata , Nilanjan Ray

分类：机器学习

2022-08-16

本文的重点是概念证明，机器学习（ML）管道，该管道从低功率边缘设备上获取的压力传感器数据中提取心率。 ML管道包括一个UPS采样器神经网络，信号质量分类器以及优化的1D横向扭转神经网络，以高效且准确的心率估计。这些型号的设计使管道小于40 kb。此外，开发了由UPS采样器和分类器组成的杂种管道，然后开发了峰值检测算法。管道部署在ESP32边缘设备上，并针对信号处理进行基准测试，以确定能量使用和推理时间。结果表明，与传统算法相比，提出的ML和杂种管道将能量和时间减少82％和28％。 ML管道的主要权衡是准确性，平均绝对误差（MAE）为3.28，而混合动力车和信号处理管道为2.39和1.17。因此，ML模型显示出在能源和计算约束设备中部署的希望。此外，ML管道的较低采样率和计算要求可以使自定义硬件解决方案降低可穿戴设备的成本和能源需求。

translated by 谷歌翻译

Inverse Extended Kalman Filter -- Part II: Highly Non-Linear and Uncertain Systems

Himali Singh , Arpan Chattopadhyay , Kumar Vijay Mishra

分类： (统计)机器学习

2022-08-13

最近的反对抗性系统设计问题促使贝叶斯过滤器的反向发展。例如，最近已经制定了逆卡尔曼过滤器（I-KF），以估算对手的卡尔曼滤波器跟踪估计值，因此可以预测对手的未来步骤。本文和伴随论文（第一部分）的目的是通过提出反向扩展的卡尔曼过滤器（I-EKF）来解决非线性系统中的反过滤问题。在同伴论文（第一部分）中，我们发展了I-EKF（有或没有未知输入）和I-KF（未知输入）的理论。在本文中，我们为高度非线性模型开发了这一理论，该模型采用了二阶，高斯总和和抖动的前向EKF。特别是，我们使用有界的非线性方法来得出二阶EKF的理论稳定性保证。为了解决系统模型和正向滤波器对防御者完全知道的标准I-EKF的限制，我们建议复制核基于Hilbert Space基于空间的EKF，以根据其观察值学习未知的系统动力学，可以用作该动态反向过滤器推断对手的估计值。数值实验证明了使用递归的cram \'{e} r-rao下限作为基准测试的拟议过滤器的状态估计性能。

translated by 谷歌翻译

Online Reinforcement Learning for Periodic MDP

Ayush Aniket , Arpan Chattopadhyay

分类：机器学习

2022-07-25

我们在定期马尔可夫决策过程（MDP）中学习学习，这是一种特殊类型的非平稳MDP，在平均奖励最大化设置下，状态过渡概率和奖励功能都定期变化。我们通过使用周期指数来扩大状态空间来将问题作为固定的MDP提出，并提出了定期上限置信度结合增强学习2（PUCRL2）算法。我们表明，pucrl2的遗憾随着时期和地平线长度的次线性而变化。数值结果证明了PUCRL2的功效。

translated by 谷歌翻译

Deep Analysis of Visual Product Reviews

Chandranath Adak , Soumi Chattopadhyay , Muhammad Saqib

分类：计算机视觉

2022-07-19

随着电子商务行业的扩散，分析客户反馈是服务提供商必不可少的。最近几天，可以注意到，客户以评论分数上传购买的产品图像。在本文中，我们承担了分析此类视觉评论的任务，这是非常新的。过去，研究人员致力于分析语言反馈，但是在这里，我们没有从语言评论中获得任何可能不存在的帮助，因为可以观察到最近的趋势，客户喜欢快速上传视觉反馈而不是输入语言反馈。我们提出了一个分层体系结构，高级模型参与产品分类，而低级模型则注意从客户提供的产品图像预测评论得分。我们通过采购真实的视觉产品评论来生成数据库，这非常具有挑战性。我们的体系结构通过对所采用的数据库进行广泛的实验，从而获得了一些有希望的结果。拟议的分层体系结构比单层最佳可比架构的性能提高了57.48％。

translated by 谷歌翻译